SAM 3
https://gyazo.com/109335e3e675b7bd8beb9f77bc489829
https://ai.meta.com/blog/segment-anything-model-3/Project
https://github.com/facebookresearch/sam3facebookresearch/sam3
https://www.aidemos.meta.com/segment-anything/galleryPlayground
SAM 2と同様ポイント・BBOX・マスクの他に、テキストプロンプト・参考画像を元にセグメンテーションを行える
https://github.com/facebookresearch/sam3/blob/main/examples/sam3_agent.ipynbSAM 3 Agent
SAM3をMLLMのtoolとして使わせるnotebook
ことでより複雑な指示にも対応できるようにする
ComfyUI実装 (ローカルLLM対応)
https://github.com/adambarbato/ComfyUI-Segmentation-Agentadambarbato/ComfyUI-Segmentation-Agent
VLM自体がセグメンテーションに特化しているわけではないので、Sa2VAやGrounding SAMと比べて明克に強いわけでは無いらしい
実装
https://github.com/wouterverweirder/comfyui_sam3?tab=readme-ov-filewouterverweirder/comfyui_sam3
https://github.com/Ltamann/ComfyUI-TBG-SAM3Ltamann/ComfyUI-TBG-SAM3
https://github.com/1038lab/ComfyUI-RMBG1038lab/ComfyUI-RMBG
← SAM2.1
#Meta